### 📋 Краткая инструкция по настройке вашей программы TTS

**1. Установите необходимые модули Python**

Откройте терминал/командную строку и выполните:


pip install torch torchaudio
pip install scipy numpy
pip install pygame
```

Если при установке `torchaudio` возникнут ошибки из-за torchcodec, установите базовую версию:
```bash
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cpu
pip install scipy numpy pygame
```

**2. Скачайте и разместите модель Silero**

1. Перейдите на официальный сайт Silero: https://models.silero.ai/models/tts/ru/v5_1_ru.pt
2. Скачайте файл модели `v5_1_ru.pt`
3. Поместите его в папку: **`D:\TTS\Silero\`**
4. Создайте в той же папке файл `models.json` со следующим содержимым:

```json
{
    "v5_1_ru": {
        "file": "v5_1_ru.pt",
        "voices": ["aidar", "baya", "kseniya", "xenia", "eugene", "random"],
        "sample_rate": 48000,
        "description": "Улучшенная модель Silero v5"
    }
}
```

**3. Убедитесь в наличии FFmpeg**

Ваша программа использует FFmpeg для конвертации форматов. Убедитесь, что он установлен и доступен в PATH:
- Скачайте с **[https://ffmpeg.org/download.html](https://ffmpeg.org/download.html)**
- Распакуйте и добавьте папку `bin` в системный PATH
- Или поместите `ffmpeg.exe` прямо в папку с вашей программой

**Финальная структура папки `D:\TTS\Silero\`:**
```
D:\TTS\Silero\
├── v5_1_ru.pt          (скачанная модель)
└── models.json         (конфигурационный файл)
```

После этого  программа готова к работе. Она будет автоматически загружать модель и использовать выбранный голос для конвертации текста в речь с оптимальной нагрузкой на процессор (~50% CPU).